AI资讯新闻榜单内容搜索-DeepSeek

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: DeepSeek
DeepSeek 还能这么玩? 我用它修仙、宫斗、末日求生,太上头了

DeepSeek 还能这么玩? 我用它修仙、宫斗、末日求生,太上头了

DeepSeek 还能这么玩? 我用它修仙、宫斗、末日求生,太上头了

前几天元旦,DeepSeek 又激发了「假期更新」 Buff,梁文锋署名新论文刷屏 AI 圈,就在大家都在等待 V4 的发布时,我发现有一群人早就在 DeepSeek 里找到了新乐子:自制「橙光游戏」。

来自主题: AI资讯
8025 点击    2026-01-11 10:04
一年后,DeepSeek-R1的每token成本降到了原来的1/32

一年后,DeepSeek-R1的每token成本降到了原来的1/32

一年后,DeepSeek-R1的每token成本降到了原来的1/32

几天前,DeepSeek 毫无预兆地更新了 R1 论文,将原有的 22 页增加到了现在的 86 页。新版本充实了更多细节内容,包括首次公开训练全路径,即从冷启动、训练导向 RL、拒绝采样与再微调到全场景对齐 RL 的四阶段 pipeline,以及「Aha Moment」的数据化验证等等。

来自主题: AI技术研报
7190 点击    2026-01-10 17:02
DeepSeek V4爆春节登场!四大杀招突袭全球编程王座,Claude危

DeepSeek V4爆春节登场!四大杀招突袭全球编程王座,Claude危

DeepSeek V4爆春节登场!四大杀招突袭全球编程王座,Claude危

Information爆料称,DeepSeek将计划在2月中旬,也正是春节前后,正式发布下一代V4模型。据称,DeepSeek V4编程实力可以赶超Claude、GPT系列等顶尖闭源模型。

来自主题: AI资讯
8331 点击    2026-01-10 11:23
毫无征兆!DeepSeek R1爆更86页论文,这才是真正的Open

毫无征兆!DeepSeek R1爆更86页论文,这才是真正的Open

毫无征兆!DeepSeek R1爆更86页论文,这才是真正的Open

两天前,DeepSeek悄无声息地把R1的论文更新了,从原来22页「膨胀」到86页。DeepSeek向世界证明:开源不仅能追平闭源,还能教闭源做事!

来自主题: AI技术研报
8408 点击    2026-01-08 11:44
体验英伟达 AI 个人超算「核弹」DGX Spark,能微调出 DeepSeek R2 吗

体验英伟达 AI 个人超算「核弹」DGX Spark,能微调出 DeepSeek R2 吗

体验英伟达 AI 个人超算「核弹」DGX Spark,能微调出 DeepSeek R2 吗

最近,APPSO 终于拿到了这台来自黄仁勋倾情推荐的个人超算,英伟达 DGX Spark;到手的第一感觉,就是「小而美」。这电脑也太小了,没有 Mac Studio 那般笨重,可能就和 Mac Mini 差不多大;然后是银色的亮和用来散热的金属丝网又让它有点不一样,是专属的硬核美感。

来自主题: AI资讯
7762 点击    2025-12-31 15:19
刚刚,DeepSeek梁文锋入选Nature年度十大人物!被称为「科技颠覆者」

刚刚,DeepSeek梁文锋入选Nature年度十大人物!被称为「科技颠覆者」

刚刚,DeepSeek梁文锋入选Nature年度十大人物!被称为「科技颠覆者」

刚刚,梁文锋入选《自然》2025年度十大人物榜单!Nature给出的评语是:科技颠覆者!正式报道中,则用「这位中国金融奇才的DeepSeek AI模型惊艳了世界」。

来自主题: AI资讯
9361 点击    2025-12-09 10:17
DeepSeek V3到V3.2的进化之路,一文看全

DeepSeek V3到V3.2的进化之路,一文看全

DeepSeek V3到V3.2的进化之路,一文看全

12 月 1 日,DeepSeek 一口气发布了两款新模型:DeepSeek-V3.2 和 DeepSeek-V3.2-Speciale。几天过去,热度依旧不减,解读其技术报告的博客也正在不断涌现。知名 AI 研究者和博主 Sebastian Raschka 发布这篇深度博客尤其值得一读,其详细梳理了 DeepSeek V3 到 V3.2 的进化历程。

来自主题: AI技术研报
8076 点击    2025-12-08 12:48
DeepSeek-V3.2巨「吃」Token,竟然是被GRPO背刺了

DeepSeek-V3.2巨「吃」Token,竟然是被GRPO背刺了

DeepSeek-V3.2巨「吃」Token,竟然是被GRPO背刺了

DeepSeek 一发布模型,总会引起业内的高度关注与广泛讨论,但也不可避免的暴露出一些小 Bug。

来自主题: AI技术研报
5972 点击    2025-12-05 10:05
DeepSeek V3.2爆火,Agentic性能暴涨40%解密

DeepSeek V3.2爆火,Agentic性能暴涨40%解密

DeepSeek V3.2爆火,Agentic性能暴涨40%解密

DeepSeek V3.2的Agentic能力大增,离不开这项关键机制:Interleaved Thinking(交错思维链)。Interleaved Thinking风靡开源社区背后,离不开另一家中国公司的推动。

来自主题: AI技术研报
7936 点击    2025-12-04 14:58